Tanya Pomodo
Semua Artikel
Teknologi
Bisnis
Sains
Finansial
Semua
entitas
SWE-BENCH LITE
SWE-bench Lite adalah benchmark yang digunakan untuk mengukur kemampuan model AI dalam menyelesaikan tugas debugging perangkat lunak. Ini berisi serangkaian tugas yang dirancang untuk menguji efektivitas model dalam pemrograman.
Teknologi
5 bulan lalu
199 dibaca
Studi Microsoft: AI Sulit Pecahkan Bug, Pemrogram Manusia Tetap Penting